Consulta de Guías Docentes



Academic Year/course: 2020/21

30207 - Statistics


Syllabus Information

Academic Year:
2020/21
Subject:
30207 - Statistics
Faculty / School:
110 - Escuela de Ingeniería y Arquitectura
326 - Escuela Universitaria Politécnica de Teruel
Degree:
439 - Bachelor's Degree in Informatics Engineering
443 - Bachelor's Degree in Informatics Engineering
ECTS:
6.0
Year:
1
Semester:
Second semester
Subject Type:
Basic Education
Module:
---

1. General information

2. Learning goals

3. Assessment (1st and 2nd call)

4. Methodology, learning tasks, syllabus and resources

4.1. Methodological overview

The proposed methodology aims at encouraging students for everyday work. The student's interest is promoted by means of a practical approach based on the use of actual problems and data. 

The general principles of this course are presented in large-group-sessions where a formal description is carried out with applications in standard examples these classes are complemented with real problem classes in small groups. Classes in computer room deal with both data analysis and modelling of real events. Students completing them will be able to use specific statistical software.

4.2. Learning tasks

This course includes the following learning tasks:

  • Block 1: Explanatory Analysislysus
  • Block 2: Probability models
  • Block 3:  Statistical inference

4.3. Syllabus

The course will address the following topics: 

BLOCK 1: EXPLORATORY DATA ANALYSIS

1. Descriptive statistics for one variable: descriptive measures (location, dispersión, skewness and kurtosis) and univariate graphs.

2. Model-checking: Percentiles and probability plots.

3. Descriptive statistics for several variables: association measures, correlation coefficient, smoothing and fitting simple regression lines to data.

BLOCK 2: PROBABILITY MODELS

1. Introduction to probability: Random experiments. Sample space and events. The axioms of probability. Consequences. Conditional probability. Partition of the sample space. Total probability rule and Bayes formula. Independence of two events. Mutually independent events.

2. Random variables and characteristics: Definition of a random variable: discrete and continuous. Distribution function. Probability mass function. Discrete random variable. Continuous random variable: density function. Conditional distribution. The expected value of a random variable. The expected value of a function of a random variable. Properties of the expected value. Variance and its properties. Standard deviation. Skewness and kurtosis. Percentile. Probability bounds: Chebyshev's inequality.

3. Main probability models: Sampling with and without replacement. Hypergeometric distribution. Bernoulli process: Bernoulli, binomial, geometric and negative binomial distributions. Poisson process: Poisson, exponential and gamma distribution. Uniform and normal distributions.

4. Multivariate random variables. Joint, marginal and conditional distributions. Conditional expected value. Independent variables. Reproductive property of a sum of variables.

BLOCK  3: STATISTICAL INFERENCE

1. Random sampling: Likelihood function. Statistics. Sampling distribution. Chi-squared, t-Student and F-Snedecor distributions. Central limit theorem. Fisher theorem. Computation of the random sample size.

2. Point estimation and confidence intervals: Unbiased estimators. The variance of a Point Estimator. Standard Error. Methods of point estimation, method of moments and maximum likelihood. Optimization in Inference. Confidence intervals on the mean, the variance and a population proportion.

3. Tests of hypothesis: Hypothesis testing. Null and alternative hypothesis. One-sided and two-sided hypotheses. Type I and type II errors. Power and sample size. The connection between hypothesis tests and confidence intervals. Tests on the mean, variance and a population proportion. Statistical inference for two samples. Tests on the difference in means, on the ratio of the variances and on two population proportions. Paired t-test. Independence tests. Chi-Squared test.

4.4. Course planning and calendar

 The course corresponds to 6 ECTS equivalent to 150 hours of activities for students with the following distribution:

Classroom activities

  • 30 hours (2hours/week)  master class in large-group-class.
  • 15 hours (1 hour/week) of problems in a small group (2 groups)
  • 14 h (7 classes of  2 hours 2hour/2week) in the computer room in a small group (4 groups)

Out of classroom activities

  • Self-study 70 h
  • Statistical report 15 h

Evaluation activities

  • 6 hours


Curso Académico: 2020/21

30207 - Estadística


Información del Plan Docente

Año académico:
2020/21
Asignatura:
30207 - Estadística
Centro académico:
110 - Escuela de Ingeniería y Arquitectura
326 - Escuela Universitaria Politécnica de Teruel
Titulación:
439 - Graduado en Ingeniería Informática
443 - Graduado en Ingeniería Informática
Créditos:
6.0
Curso:
1
Periodo de impartición:
Segundo semestre
Clase de asignatura:
Formación básica
Materia:
Estadística

1. Información Básica

1.1. Objetivos de la asignatura

La asignatura y sus resultados previstos responden a los siguientes planteamientos y objetivos:

En esta signatura se cubren aspectos de recopilación, presentación y tratamiento de datos, así como de extracción de conclusiones a partir de la información que proporcionan. Además, el estudiante aprende a modelar situaciones reales en presencia de incertidumbre y a utilizar técnicas de optimización en Inferencia. El objetivo final es que el estudiante integre los conocimientos que se cursan en la asignatura en el contexto formativo de la titulación y, en la medida posible, sea autosuficiente en la utilización de las técnicas estadísticas en el desarrollo de sus labores profesionales.

1.2. Contexto y sentido de la asignatura en la titulación

 

La asignatura se ubica en el segundo cuatrimestre del primer curso de la titulación y forma parte de las materias de formación básica del grado de ingeniería Informática.

La asignatura es obligatoria y forma parte de la formación básica de los estudiantes.

La asignatura está situada en el segundo cuatrimestre de primer curso, una vez que el estudiante ha adquirido una formación básica en Matemáticas, y se imparte simultáneamente a materias que inician su formación en programación y arquitectura de computadores, así como a asignaturas de fundamentos físicos de la informática y de aspectos matemáticos propios de la informática.

La asignatura será de utilidad para el futuro graduado/graduada en Informática al dotarle de una base científica que le guiará en la toma de decisiones al analizar información procedente de bases de datos. Asimismo se le proporciona una base sólida para modelar problemas que incorporen aleatoriedad.

1.3. Recomendaciones para cursar la asignatura

Se aconseja a los alumnos y alumnas cursar la asignatura de manera presencial. Los estudiantes que sigan de forma presencial y continuada la asignatura deberán superar las pruebas de evaluación programadas a lo largo del curso. Aquellos que no sigan la asignatura de forma presencial y continuada deberán superar una prueba de evaluación final referente a todos los módulos de contenido.

2. Competencias y resultados de aprendizaje

2.1. Competencias

Al superar la asignatura, el estudiante será más competente para...

Resolver problemas y tomar decisiones con iniciativa, creatividad y razonamiento crítico. (CT4)

Comunicar y transmitir conocimientos, habilidades y destrezas en castellano. (CT5)

Aprender de forma continuada y desarrollar estrategias de aprendizaje autónomo. (CT10)

La resolución de problemas matemáticos que puedan plantearse en la ingeniería. Aptitud para aplicar los conocimientos sobre: estadística y optimización básica. (CG01)

2.2. Resultados de aprendizaje

El estudiante, para superar esta asignatura, deberá demostrar:

  1. Maneja los fundamentos del cálculo de probabilidades y las técnicas en relación con las distribuciones de probabilidad para identificar la estructura estocástica que subyace al comportamiento de un sistema real.
  2. Aplica las técnicas de tratamiento y análisis estadístico de datos para extraer el conocimiento de los mismos.
  3. Utiliza programas informáticos para el tratamiento de datos.
  4. Plantea e interpreta los contrastes de hipótesis como soporte sólido al proceso de toma de decisiones.
  5. Elabora un informe estadístico que representa el problema bajo estudio, analiza los resultados de forma crítica, y propone recomendaciones en lenguaje comprensible para la toma de decisiones.
  6. Identifica y formula problemas de optimización en el marco de la Inferencia Estadística.

2.3. Importancia de los resultados de aprendizaje

 

Un ingeniero/ingeniera informático debe manejar con regularidad información procedente de bases de datos y ha de estar capacitado para tomar decisiones a partir de ésta. La asignatura proporciona al ingeniero un conjunto de técnicas estadísticas básicas con esta finalidad.

Los estudiantes aprenden a reconocer y manejar modelos que sirven para abordar situaciones en las que hay incertidumbre y aprenden a plantear y resolver problemas sencillos de optimización en el contexto de la Inferencia Estadística.

Además, los estudiantes trabajan en grupo y con datos reales, por lo que también desarrollan competencias de colaboración en equipo en la resolución de problemas reales.

3. Evaluación

3.1. Tipo de pruebas y su valor sobre la nota final y criterios de evaluación para cada prueba

El estudiante deberá demostrar que ha alcanzado los resultados de aprendizaje previstos mediante las siguientes actividades de evaluación.

La evaluación global de la asignatura comprende las siguientes actividades realizadas durante el periodo docente:

  1. Una prueba escrita realizada de manera individual por el grupo completo de estudiantes durante el periodo de docencia de la asignatura referente al módulo Modelos de distribución de probabilidad. (Resultado del aprendizaje 1)
  2. Una prueba escrita realizada de manera individual por el grupo completo de estudiantes en la convocatoria oficial de la asignatura referente al módulo Muestreo, estimación y contrastes de hipótesis. (Resultados del aprendizaje 2 y 4).
  3. Una prueba escrita realizada de manera individual por el grupo completo de estudiantes referente a los contenidos desarrollados en las clases de prácticas de la asignatura en laboratorio informático a realizar durante el periodo de docencia de la asignatura y/o en la convocatoria oficial. (Resultados del aprendizaje 1, 2, 3, 4 y 6)
  4. Un informe estadístico realizado por el grupo completo de estudiantes donde aplique algunas de las diferentes técnicas estadísticas estudiadas a lo largo del curso a realizar antes de la convocatoria oficial. (Resultados del aprendizaje 1, 2, 3, 4, 5 y 6)

Los alumnos y alumnas que no realicen la prueba propuesta en el punto 1 anterior programada durante el curso, deberán realizarla en la convocatoria oficial de la asignatura correspondiente a la evaluación global.

Niveles de exigencia

Las pruebas escritas correspondientes a los puntos 1 y 2 de la sección anterior suponen un 40% y un 30%, respectivamente, en la calificación final; para superar el 70% que suponen ambas, el estudiante ha de obtener una nota de al menos 4.5 puntos (sobre 10) en la prueba 1  y de 4 puntos (sobre 10) en la prueba 2 y una nota media entre ambas de al menos 5 puntos.

Los resultados de aprendizaje relativos a la destreza en el análisis estadístico de datos se evaluarán con la calificación conjunta del informe y de las actividades de evaluación formativa realizadas durante todo el curso ligadas al laboratorio informático. Tiene un valor del 30% de la calificación final. El estudiante ha de obtener una calificación de al menos 5 puntos sobre 10 en cada una de estas actividades.

Para superar la asignatura el estudiante deberá obtener una calificación final de al menos 5 puntos sobre 10.

4. Metodología, actividades de aprendizaje, programa y recursos

4.1. Presentación metodológica general

El proceso de aprendizaje que se ha diseñado para esta asignatura se basa en lo siguiente:

 

La metodología que se propone trata de fomentar el trabajo continuado del estudiante y se centra en los aspectos más prácticos de la Estadística: el trabajo con datos reales.

En las sesiones con el grupo completo se tratan aspectos teóricos en forma de clase magistral que se complementan con su aplicación a la resolución de problemas de naturaleza real en las clases de problemas en grupos reducidos. El tratamiento con datos reales se realiza en las sesiones en el laboratorio informático en las que se aprende a manejar software estadístico.

La evaluación se centra tanto en aspectos teóricos como aplicados de acuerdo con los criterios de evaluación establecidos.

4.2. Actividades de aprendizaje

Se plantean los siguientes módulos de aprendizaje:

  1. Módulo 1: Análisis exploratorio de datos.
  2. Módulo 2: Modelos de distribución de probabilidad.
  3. Módulo 3: Muestreo, estimación y contrastes de hipótesis.

 

 

 

4.3. Programa

MÓDULO 1: ANÁLISIS EXPLORATORIO DE DATOS

1. Análisis exploratorio de una variable: Medidas descriptivas (localización, dispersión y forma) y representaciones gráficas.

2. Ajuste de distribuciones: Cálculo de percentiles y gráficos de probabilidad.

3. Análisis exploratorio de varias variables: Relaciones entre variables, coeficiente de correlación, suavizado y modelos de regresión lineal.

MÓDULO 2: MODELOS DE DISTRIBUCIÓN DE PROBABILIDAD.

1. Introducción al cálculo de probabilidades: Experimento aleatorio. Definición de probabilidad. Probabilidad condicionada. Sistema completo de sucesos. Teorema de la probabilidad total. Teorema de Bayes. Independencia de sucesos.

2. Variables aleatorias y características: Definición de variables aleatorias: discretas y continuas. Función de masa de probabilidad. Función de densidad. Función de distribución. Esperanza y propiedades. Momentos de una variable aleatoria: media, varianza, coeficiente de asimetría y curtosis. Percentiles, rango intercuartílico e interdecílico. Cotas de probabilidad: Desigualdad de Chebychev.

3. Modelos de probabilidad discretos y continuos usuales: Muestreos con y sin reemplazamiento. Hipergeométrica. Proceso de Bernoulli: Bernoulli, binomial, geométrica y binomial negativa. Proceso de Poisson: Poisson, exponencial y gamma. Distribución uniforme y normal.

4. Modelos de probabilidad multivariantes: Distribución conjunta, marginal y condicionada. Esperanza condicionada. Independencia de variables aleatorias. Suma de variables aleatorias. Propiedad reproductiva.

MÓDULO 3: INFERENCIA ESTADÍSTICA

1. Muestreo: Muestra aleatoria simple. Función de verosimilitud. Estadísticos. Distribución en el muestreo. Distribución chi-cuadrado de Pearson, t de Student y F de Snedecor-Fisher. Teorema central del límite. Teorema de Fisher. Cálculo de tamaño muestral.

2. Estimación puntual y por intervalo: Estimador y error cuadrático medio. Propiedades. Estimador de máxima verosimilitud.  Estimador por método de momentos. Optimización en Inferencia. Estimación por intervalo de confianza. Cálculo de intervalos de confianza para medias, varianzas y proporciones.

3. Contrastes de hipótesis: Hipótesis nula y alternativa. Región crítica. Errores de tipo I y II. Nivel de significación del contraste y potencia del contraste. Relación entre intervalos de confianza y contrastes de hipótesis. Contrastes de hipótesis para medias, varianzas y proporciones. Contraste de bondad del ajuste.

 

4.4. Planificación de las actividades de aprendizaje y calendario de fechas clave

El estudiante tiene que cursar 6 créditos ECTS, es decir, 150h.

Actividades presenciales

  • 30 h de clase magistral
  • 15 h de problemas en grupos reducidos (2 subgrupos)
  • 14 h (7 sesiones de 2 h) de prácticas en el laboratorio informático en grupos reducidos (4 subgrupos)

Actividades no presenciales

  • Estudio personal efectivo 70 h
  • Realización del informe estadístico 15 h

Actividades de evaluación

  • 6 h

 

Pruebas escritas de evaluación de los módulos Modelos de distribución de probabilidadMuestreo, estimación y contraste de hipótesis. Una prueba de evaluación mediante prueba escrita o en el laboratorio de informática correspondiente a los contenidos de prácticas desarrollados durante el curso. Además será obligatoria la presentación de un informe estadístico referido a datos reales o simulados en el que se apliquen una buena parte de las técnicas estadísticas estudiadas a lo largo del curso.

En el entorno de la  semana 10 del curso se realizará una prueba escrita del Modelos de distribución de probabilidad. Al final del curso se realizará una prueba escrita sobre el módulo Muestreo, estimación y contraste de hipótesis y una prueba escrita o en el laboratorio informático acerca de los contenidos de las sesiones en el laboratorio informático. El informe estadístico se realiza a lo largo del curso y hay de plazo para entregarlo hasta el día de la convocatoria oficial de examen de la asignatura.

 

En cada convocatoria oficial  los alumnos que no hayan superado las pruebas de evaluación referidas al  párrafo anterior, tendrán que realizar una prueba de evaluación que incluirá  todos los módulos de contenidos desarrollados durante el curso.